Filtrage bayésien de la récompense

نویسندگان

  • Matthieu Geist
  • Olivier Pietquin
  • Gabriel Fricout
چکیده

Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail général pour l’apprentissage par renforcement basé sur le filtrage bayésien, ainsi qu’une implémentation spécifique basée sur un filtre de Kalman à sigma-points et une paramétrisation par noyaux. Cela nous permet de proposer un algorithme de différences temporelles pour des espaces d’état et/ou d’action continus qui soit model-free et off-policy. Il sera illustré sur deux problèmes simples. Mots-clés : Apprentissage par renforcement, filtrage bayésien, méthodes à noyaux.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Le filtrage collaboratif et le web 2.0. État de l'art

RÉSUMÉ. Le présent article fait le point sur l’état de l’art des systèmes de filtrage d’information. Il présente les différentes techniques de filtrage proposées dans la littérature dont le filtrage à base de contenu, le filtrage collaboratif et les modèles de filtrage hybrides. Il présente également les différentes limitations dont souffre toujours ce type de systèmes notamment la rareté des v...

متن کامل

RELIEFS : Un système pour le filtrage adaptatif de documents textuels basé sur la notion de résonance

Résumé : Nous présentons le système RELIEFS pour RELevance Information Extraction Fuzzy System dédié au filtrage adaptatif de documents textuels. Ce système s'inspire très largement de mécanismes cognitifs intervenant dans les processus de sélection d'information. En particulier, il implémente l'idée de résonance introduite dans la théorie cognitive ART [GROS 76] qui rend compte de la façon don...

متن کامل

COCoFil: une plateforme de filtrage collaboratif orientée vers la communauté

RÉSUMÉ. Face à la quantité et la rapidité d'apparition de nouvelles informations au quotidien, l’utilisateur peut s’en remettre non seulement à des systèmes de filtrage d’information par le contenu mais aussi à des systèmes de filtrage collaboratif. Ainsi, il peut recevoir des recommandations grâce aux évaluations de la communauté des personnes partageant les mêmes centres d'intérêt. Cependant,...

متن کامل

Modèle d'espaces de communautés basé sur la théorie des ensembles d'approximation dans un système de filtrage hybride

RÉSUMÉ. Les systèmes de filtrage ont pour but de distribuer des informations de façon personnalisée aux utilisateurs, tout en s’adaptant en permanence au besoin en information de chacun. Dans un système de filtrage hybride s’appuyant sur le filtrage collaboratif, la production de recommandations se base sur des communautés d’utilisateurs qui sont généralement formées conformément au seul critèr...

متن کامل

Apprentissage par renforcement dans un système de filtrage adaptatif

RÉSUMÉ. Cet article présente une méthode incrémentale d’apprentissage des profils dans les systèmes de filtrage d’information. Cette méthode est basée sur le principe de renforcement. L’idée de base consiste à construire, à chaque arrivée d’un document pertinent, un profil " provisoire " permettant de sélectionner le document en question avec un score " fort ", puis intégrer ce profil, grâce à ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008